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ADM72285 

ID ADM72285 standard; protein; 1030 AA. 

XX 

AC ADM72285; 

XX 

DT 17-JUN-2004 (first entry) 

XX 

DE Porcine TLR9 polypeptide. 

XX 

KW TLR9; toll-like receptor 9; CpG; TLR9 signaling; porcine. 

XX 

OS Sus scrofa. 

XX 

PN WO2004026888-A2. 

XX 

PD 01-APR-2004. 

XX 

PF 19-SEP-2003; 2 003WO-US029 5 7 7 . 

XX 

PR 19-SEP-2002; 2 002US-0 4 12 4 79P . 
XX 

PA (COLE-) COLEY PHARM GMBH. 

PA (UYSA-) UNIV SASKATCHEWAN. 

PA (QIAG-) QIAGEN GMBH. 
XX 

PI Lipford GB, Mookherjee N, Babiuk L, Brownlie R, Griebel P; 

PI Mutwiri G, Hecker R; 

XX 

DR WPI; 2004-295374/27. 

DR N-PSDB; ADM72287. 
XX 

PT New polypeptide, useful for identifying key amino acids in a TLR9 of a 

PT first species which confer specificity for CpG DNA optimized for TLR9 of 

PT the first species . 
XX 

PS Claim 1; SEQ ID NO 5; 170pp; English. 

XX 

CC The invention relates to novel Toll-like receptor 9 (TLR9) polypeptides 

CC and encoding polynucleotides. It provides methods for (i) identifying key 

CC amino acids in a TLR9 of a first species which confer specificity for CpG 

CC DNA optimized for TLR9 of the first species; (ii) identifying key amino 

CC acids in human TLR9 which confer specificity for CpG DNA optimized for 

CC human TLR9; (iii) identify a TLR9 ligand; and (iv) identify species- 

CC specific CpG-motif preference of the isolated polypeptide. The screening 

CC method to identify species-specific CpG-motif preference of the isolated 

CC polypeptide comprises: contacting an isolated polypeptide with a CpG DNA 

CC comprising a hexamer seguence consisting of GACGTT, AACGTT, CACGTT, 

CC TACGTT, GGCGTT, GCCGTT, GTCGTT , GATGTT, GAAGTT, GAGGTT, GACATT, GACCTT, 

CC GACTTT, GACGCT, GACGAT, GACGGT, GACGTC , GACGTA and GACGTG; measuring a 

CC signal in response to the contacting; and identifying a species-specific 

CC CpG-motif preference when the signal in response to the contacting is 

CC consistent with TLR9 signaling. The signal comprises expression of a 

CC reporter gene responsive to TLR/IL-1R signal transduction pathway. The 

CC reporter gene is operatively linked to a promoter sensitive to NF-KB. The 

CC CpG DNA is an oligodeoxynucleotide having a seguence consisting of 

CC seguences selected from ADM72319- ADM72337. The polypeptide is useful for 

CC identifying key amino acids in a TLR9 of a first species which confer 

CC specificity for CpG DNA optimized for TLR9 of the first species. The 

CC present seguence represents a porcine TLR9 polypeptide 

XX 

SQ Seguence 1030 AA; 
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Alignment Scores: 

Length: 1030 

Score: 5400.00 Matches: 1026 

Percent Similarity: 99.6% Conservative: 0 

Best Local Similarity: 99.6% Mismatches: 4 

Query Match: 86.4% Indels: 0 

DB: 1 Gaps: 0 

US-10-561-022-1 (1-3329) x ADM72285 (1-1030) 

Qy 55 ATGGGCCCCCGCTGCACCCTGCACCCCCTTTCTCTCCTGGTGCAGGTGACAGCGCTGGCT 114 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 MetGlyProArgCysThrLeuHisProLeuSerLeuLeuValGlnValThrAlaLeuAla 20 

Qy 115 GCGACTCTGGCCCAGGGCAGGCTGCCTGCCTTCCTGCCCTGTGAGCTCCAGCCCCACGGC 174 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 21 AlaAlaLeuAlaGlnGlyArgLeuProAlaPheLeuProCysGluLeuGlnProHisGly 40 

Qy 175 CTGGTGAACTGCAACTGGCTCTTCCTGAAGTCCGTGCCCCACTTCTCGGCGGCAGCGCCC 23 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 41 LeuValAsnCysAsnTrpLeuPheLeuLysSerValProHisPheSerAlaAlaAlaPro 60 

Qy 235 CGGGCCAACGTCACCAGCCTCTCCTTACTCTCCAACCGCATCCACCACTTGCACGACTCT 294 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 ArgAlaAsnValThrSerLeuSerLeuLeuSerAsnArglleHisHisLeuHisAspSer 80 

Qy 2 95 GACTTCGTCCACCTGTCCAGCCTACGAACTCTCAACCTCAAGTGGAACTGCCCGCCGGCT 354 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 81 AspPheValHisLeuSerSerLeuArgThrLeuAsnLeuLysTrpAsnCysProProAla 100 

Qy 355 GGCCTCAGCCCCATGCACTTCCCCTGCCACATGACCATCGAGCCCAACACCTTCCTGGCC 414 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 101 GlyLeuSerProMetHisPheProCysHisMetThrlleGluProAsnThrPheLeuAla 120 

Qy 415 GTGCCCACCCTGGAGGAGCTGAACCTGAGCTACAACAGCATCACGACCGTGCCTGCCCTG 4 74 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 ValProThrLeuGluGluLeuAsnLeuSerTyrAsnSerlleThrThrValProAlaLeu 140 

Qy 475 CCCGACTCCCTCGTGTCCCTGTCGCTGAGCCGCACCAACATCCTGGTGCTAGACCCCACC 534 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 141 ProAspSerLeuValSerLeuSerLeuSerArgThrAsnlleLeuValLeuAspProThr 160 

Qy 535 CACCTCACTGGCCTACATGCCCTGCGCTACCTGTACATGGATGGCAACTGCTAC TACAAG 594 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 161 HisLeuThrGlyLeuHisAlaLeuArgTyrLeuTyrMetAspGlyAsnCysTyrTyrLys 180 

Qy 5 95 AACCCCTGCCAGGGGGCGCTGGAGGTGGTGCCGGGTGCCCTCCTCGGCCTGGGCAACCTC 6 54 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 AsnProCysGlnGlyAlaLeuGluValValProGlyAlaLeuLeuGlyLeuGlyAsnLeu 200 

Qy 6 55 ACACATCTCTCACTCAAGTACAACAATCTCACGGAGGTGCCCCGCAGCCTGCCCCCCAGC 714 

Db 201 ThrHisLeuSerLeuLysTyrAsnAsnLeuThrGluValProArgSerLeuProProSer 220 

Qy 715 CTGGAGACCCTGCTGTTGTCCTACAACCACATTGTCACCCTGACGCCTGAGGACCTGGCC 7 74 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 221 LeuGluThrLeuLeuLeuSerTyrAsnHisIleValThrLeuThrProGluAspLeuAla 240 

Qy 7 75 AATCTGACTGCCCTGCGCGTGCTTGATGTGGGGGGGAACTGCCGCCGCTGTGACCATGCC 83 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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2 41 AsnLeuThrAlaLeuArgValLeuAspValGlyGlyAsnCysArgArgCysAspHisAla 260 

835 CGCAACCCCTGCAGGGAGTGCCCAAAGGACCACCCCAAGCTGCACTCTGACACCTTCAGC 8 9 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
261 ArgAsnProCysArgGluCysProLysAspHisProLysLeuHisSerAspThrPheSer 2 80 

8 95 CACCTGAGCCGCCTCGAAGGCCTGGTGTTGAAAGACAGTTCTCTCTACAACCTGGACGCC 9 5 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
281 HisLeuSerArgLeuGluGlyLeuValLeuLysAspSerSerLeuTyrAsnLeuAspThr 3 00 

9 55 AGGTGGTTCCGAGGCCTGGACAGGCTCCAAGTGCTGGACCTGAGTGAGAACTTCCTCTAC 1014 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 ArgTrpPheArgGlyLeuAspArgLeuGlnValLeuAspLeuSerGluAsnPheLeuTyr 3 20 

1015 GACTGCATCACCAAGACCACGGCCTTCCAGGGCCTGGCCCGACTGCGCAAGCTCAACCTG 1074 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
321 AspCysIleThrLysThrThrAlaPheGlnGlyLeuAlaArgLeuArgSerLeuAsnLeu 3 40 

10 75 TCCTTCAATTACCACAAGAAGGTGTCCTTTGCCCACCTGCACCTGGCACCCTCCTTTGGG 113 4 

3 41 SerPheAsnTyrHisLysLysValSerPheAlaHisLeuHisLeuAlaProSerPheGly 360 

1135 CACCTCCGGTCCCTGAAGGAGCTGGACATGCATGGCATCTTCTTCCGCTCGCTCAGTGAG 119 4 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
361 HisLeuArgSerLeuLysGluLeuAspMetHisGlyllePhePheArgSerLeuSerGlu 3 80 

1195 ACCACGCTCCAACCTCTGGTCCAACTGCCTATGCTCCAGACCCTGCGCCTGCAGATGAAC 125 4 

381 ThrThrLeuGlnProLeuValGlnLeuProMetLeuGlnThrLeuArgLeuGlnMetAsn 4 00 

12 55 TTCATTAACCAGGCCCAGCTCAGCATCTTTGGGGCCTTCCCTGGCCTGCTGTACGTGGAC 1314 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
401 PhelleAsnGlnAlaGlnLeuSerllePheGlyAlaPheProGlyLeuLeuTyrValAsp 4 20 

1315 CTATCGGACAACCGCATCAGCGGAGCTGCAAGGCCAGTGGCCATTACTAGGGAGGTGGAT 137 4 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
421 LeuSerAspAsnArglleSerGlyAlaAlaArgProValAlalleThrArgGluValAsp 4 40 

13 75 GGTAGGGAGAGGGTCTGGCTGCCTTCCAGGAACCTCGCTCCACGTCCACTGGACACTCTC 143 4 

4 41 GlyArgGluArgValTrpLeuProSerArgAsnLeuAlaProArgProLeuAspThrLeu 460 

1435 CGCTCAGAGGACTTCATGCCAAACTGCAAGGCCTTCAGCTTCACCTTGGACCTGTCTCGG 149 4 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
461 ArgSerGluAspPheMetProAsnCysLysAlaPheSerPheThrLeuAspLeuSerArg 4 80 

14 95 AACAACCTGGTGACAATCCAGTCGGAGATGTTTGCTCGCCTCTCACGCCTCGAGTGCCTG 155 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
481 AsnAsnLeuValThrlleGlnSerGluMetPheAlaArgLeuSerArgLeuGluCysLeu 5 00 

15 55 CGTCTGAGCCACAACAGCATCTCCCAGGCGGTCAATGGCTCTCAGTTTGTGCCGCTGACC 1614 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
501 ArgLeuSerHisAsnSerlleSerGlnAlaValAsnGlySerGlnPheValProLeuThr 5 20 

1615 AGCCTGCGGGTGCTGGACCTGTCCCACAACAAGCTGGACCTGTATCACGGGCGCTCGTTC 16 74 

521 SerLeuArgValLeuAspLeuSerHisAsnLysLeuAspLeuTyrHisGlyArgSerPhe 5 40 

16 75 ACGGAGCTGCCGCGCCTGGAAGCACTGGACCTCAGCTACAACAGCCAGCCCTTTACCATG 173 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

5 41 ThrGluLeuProArgLeuGluAlaLeuAspLeuSerTyrAsnSerGlnProPheThrMet 560 
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1735 CAGGGTGTGGGCCACAACCTCAGCTTCGTGGCCCAGCTGCCCGCCCTGCGCTACCTCAGC 179 4 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
561 GlnGlyValGlyHisAsnLeuSerPheValAlaGlnLeuProAlaLeuArgTyrLeuSer 5 80 

17 95 CTGGCGCACAATGACATCCATAGCCGAGTGTCCCAGCAGCTCTGTAGCGCCTCACTGTGC 185 4 
581 LeuAlaHisAsnAspIleHisSerArgValSerGlnGlnLeuCysSerAlaSerLeuCys 6 00 

18 55 GCCCTGGACTTTAGCGGCAACGATCTGAGCCGGATGTGGGCTGAGGGAGACCTCTATCTC 1914 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
6 01 AlaLeuAspPheSerGlyAsnAspLeuSerArgMetTrpAlaGluGlyAspLeuTyrLeu 6 20 

1915 CGCTTCTTCCAAGGCCTAAGAAGCCTAGTCTGGCTGGACCTGTCCCAGAACCACCTGCAC 1974 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
6 21 ArgPhePheGlnGlyLeuArgSerLeuValTrpLeuAspLeuSerGlnAsnHisLeuHis 6 40 

19 75 ACCCTCCTGCCACGTGCCCTGGACAACCTCCCCAAAAGCCTGAAGCATCTGCATCTCCGT 2 03 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
6 41 ThrLeuLeuProArgAlaLeuAspAsnLeuProLysSerLeuLysHisLeuHisLeuArg 6 60 

2035 GACAATAACCTGGCCTTCTTCAACTGGAGCAGCCTGACCCTCCTGCCCAAGCTGGAAACC 2 09 4 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
661 AspAsnAsnLeuAlaPhePheAsnTrpSerSerLeuThrLeuLeuProLysLeuGluThr 6 80 

20 95 CTGGACTTGGCTGGAAACCAGCTGAAGGCCCTAAGCAATGGCAGCCTGCCATCTGGCACC 215 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

6 81 LeuAspLeuAlaGlyAsnGlnLeuLysAlaLeuSerAsnGlySerLeuProSerGlyThr 7 00 

2155 CAGCTGCGGAGGCTGGACCTCAGTGGCAACAGCATCGGCTTTGTGAACCCTGGCTTCTTT 2 214 

701 GlnLeuArgArgLeuAspLeuSerGlyAsnSerlleGlyPheValAsnProGlyPhePhe 7 20 

2215 GCCCTGGCCAAGCAGTTAGAAGAGCTCAACCTCAGCGCCAATGCCCTCAAGACAGTGGAG 2 2 7 4 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
721 AlaLeuAlaLysGlnLeuGluGluLeuAsnLeuSerAlaAsnAlaLeuLysThrValGlu 7 40 

22 75 CCCTCCTGGTTTGGCTCGATGGTGGGCAACCTGAAAGTCCTAGACGTGAGCGCCAACCCT 233 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

7 41 ProSerTrpPheGlySerMetValGlyAsnLeuLysValLeuAspValSerAlaAsnPro 760 

2335 CTGCACTGCGCCTGTGGGGCGACCTTCGTGGGCTTCCTGCTGGAGGTACAGGCTGCCGTG 239 4 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
761 LeuHisCysAlaCysGlyAlaThrPheValGlyPheLeuLeuGluValGlnAlaAlaVal 7 80 

23 95 CCTGGGCTGCCCAGCCGCGTCAAGTGTGGCAGTCCGGGGCAGCTCCAGGGCCATAGCATC 2 45 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
781 ProGlyLeuProSerArgValLysCysGlySerProGlyGlnLeuGlnGlyHisSerlle 8 00 

2 4 55 TTTGCGCAAGACCTGCGCCTCTGCCTGGATGAGACCCTCTCGTGGAACTGTTTTGGCATC 2 514 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
801 PheAlaGlnAspLeuArgLeuCysLeuAspGluThrLeuSerTrpAsnCysPheGlylle 8 20 

2515 TCGCTGCTGGCCATGGCCCTGGGCCTGGTTGTGCCCATGCTGCACCACCTCTGCGGCTGG 2574 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
821 SerLeuLeuAlaMetAlaLeuGlyLeuValValProMetLeuHisHisLeuCysGlyTrp 8 40 

25 75 GACCTCTGGTACTGCTTCCACCTGTGCCTGGCCTGGCTGCCCCACCGAGGGCAGCGGCGG 2 63 4 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

8 41 AspLeuTrpTyrCysPheHisLeuCysLeuAlaTrpLeuProHisArgGlyGlnArgArg 860 
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26 35 GGCGCAGACGCCCTGTTCTATGATGCCTTCGTGGTCTTTGACAAAGCTCAGAGTGCTGTG 2 6 9 4 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
861 GlyAlaAspAlaLeuPheTyrAspAlaPheValValPheAspLysAlaGlnSerAlaVal 8 80 

26 95 GCCGACTGGGTGTACAACGAGCTGCGGGTGCAGCTGGAGGAGCGCCGTGGGCGCCGCGCA 2 75 4 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
881 AlaAspTrpValTyrAsnGluLeuArgValGlnLeuGluGluArgArgGlyArgArgAla 9 00 

2 7 55 CTGCGCCTGTGCCTGGAGGAGCGAGACTGGTTACCTGGCAAGACGCTCTTCGAGAACCTG 2 814 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 LeuArgLeuCysLeuGluGluArgAspTrpLeuProGlyLysThrLeuPheGluAsnLeu 9 20 

2815 TGGGCCTCAGTCTACAGCAGCCGCAAGACCCTGTTTGTGCTGGCCCACACGGACCGTGTC 2874 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
921 TrpAlaSerValTyrSerSerArgLysThrLeuPheValLeuAlaHisThrAspArgVal 9 40 

28 75 AGCGGCCTCTTGCGTGCCAGTTTCCTGCTGGCCCAGCAGCGCCTGCTGGAGGACCGCAAG 2 93 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
9 41 SerGlyLeuLeuArgAlaSerPheLeuLeuAlaGlnGlnArgLeuLeuGluAspArgLys 960 

2935 GACGTTGTAGTGCTGGTGATCCTGCGCCCCGATGCCTACCGCTCCCGCTACGTGCGGCTG 2 99 4 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
961 AspValValValLeuVallleLeuArgProAspAlaTyrArgSerArgTyrValArgLeu 9 80 

29 95 CGCCAGCGCCTCTGCCGCCAGAGTGTCCTCCTCTGGCCCCACCAGCCCCGTGGGCAGGGC 3 05 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
981 ArgGlnArgLeuCysArgGlnSerValLeuLeuTrpProHisGlnProArgGlyGlnGly 1000 

3055 AGCTTCTGGGCCCAGCTGGGCACAGCCCTGACCAGGGACAACCGCCACTTCTATAACCGG 3114 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1001 SerPheTrpAlaGlnLeuGlyThrAlaLeuThrArgAspAsnHisHisPheTyrAsnArg 1020 

3115 AACTTCTGCCGGGGCCCCACGACAGCCGAA 314 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I 
1021 AsnPheCysArgGlyProThrThrAlaGlu 1030 
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